被写体ロックオン with Florence-2 and SAM2
https://gyazo.com/15e7c4250d154e8e88e09fa0f8313172
https://gyazo.com/26a74dbbc23483d4da4768b6f0657262
動画から最初の1フレームを取得
🟫ボールだけの位置情報だと腕までセグメンテーションされてしまったので、Florence-2で腕の位置を取得しnegativeとしてSAM2に入力
🟩Florence-2で取得した位置情報を使ってSAM2でセグメンテーション
context_from_mask_extend_factorを値を大きくするとpaddingが増える
SEGSでやりたかったけど、うまくいかなかったnomadoor.icon